Timothy Tickle and Brian Haas
October 10, 2016
Part 1: Overview of laboratory prep and sequence analysis.
Part 2: Characteristics of expression data and QC.
Part 1: Plotting Single Cell RNA-Seq data.
Part 2: Evaluating and defining cell populations.
Macosko et al. 2015
Zheng et al.
Based on ERCC spike-ins.
Accuracy: How well the abundance levels correlated with known spiked-in amounts.
Sensitivity: Minimum number of input RNA molecules required to detect a spike-in.
Svensson et al. 2016
Zero inflation.
Transcription stochasticity.
Higher Resolution.
Karchenko et al.
Read Counts
Counts by UMIs
# Load libraries
library(dplyr) # Dataframe manipulation
library(Matrix) # Sparse matrices
library(useful) # Corner function
library(vioplot) # Violin pots
library(scater) # Single Cell QC
library(scde) # Differential Expression
library(org.Hs.eg.db) # Gene name manipulation
library(Seurat) # Single cell General Analysis
# Load 10X data
pbmc.10X <- Read10X("./data/filtered_gene_bc_matrices/hg19")
# Memory use as a sparse matrix
object.size(pbmc.10X)
38715120 bytes
# Memory use as a dense matrix
# 18 X more
object.size(as.matrix(pbmc.10X))
709264728 bytes
# Expected raw counts (non-normalized data)
# Can give log transformed data but do not transform in setup method
pbmc.seurat <- new("seurat", raw.data=pbmc.10X)
# Display the internal pieces of the Seurat Object
slotNames(pbmc.seurat)
[1] "raw.data" "data" "scale.data"
[4] "var.genes" "is.expr" "ident"
[7] "pca.x" "pca.rot" "emp.pval"
[10] "kmeans.obj" "pca.obj" "gene.scores"
[13] "drop.coefs" "wt.matrix" "drop.wt.matrix"
[16] "trusted.genes" "drop.expr" "data.info"
[19] "project.name" "kmeans.gene" "kmeans.cell"
[22] "jackStraw.empP" "jackStraw.fakePC" "jackStraw.empP.full"
[25] "pca.x.full" "kmeans.col" "mean.var"
[28] "imputed" "mix.probs" "mix.param"
[31] "final.prob" "insitu.matrix" "tsne.rot"
[34] "ica.rot" "ica.x" "ica.obj"
[37] "cell.names" "cluster.tree" "snn.sparse"
[40] "snn.dense" "snn.k"
[1] "raw.data" "data" "scale.data"
[4] "var.genes" "is.expr" "ident"
[7] "pca.x" "pca.rot" "emp.pval"
[10] "kmeans.obj" "pca.obj" "gene.scores"
[13] "drop.coefs" "wt.matrix" "drop.wt.matrix"
[16] "trusted.genes" "drop.expr" "data.info"
[19] "project.name" "kmeans.gene" "kmeans.cell"
[22] "jackStraw.empP" "jackStraw.fakePC" "jackStraw.empP.full"
[25] "pca.x.full" "kmeans.col" "mean.var"
[28] "imputed" "mix.probs" "mix.param"
[31] "final.prob" "insitu.matrix" "tsne.rot"
[34] "ica.rot" "ica.x" "ica.obj"
[37] "cell.names" "cluster.tree" "snn.sparse"
[40] "snn.dense" "snn.k"
Raw sparse matrix
head(pbmc.seurat@raw.data)
6 x 2700 sparse Matrix of class "dgTMatrix"
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . 1 . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . 1 . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . 1 . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . 1 . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . 1 . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . 1 . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . 1 . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 1 . . . . . . . . . . . . . 1 . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
FAM138A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
OR4F5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
RP11-34P13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
AL627309.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
MIR1302-10 . . .
FAM138A . . .
OR4F5 . . .
RP11-34P13.7 . . .
RP11-34P13.8 . . .
AL627309.1 . . .
?seurat
Hiding within those mounds of data is knowledge that could change the life of a patient, or change the world. -– Atul Butte
# Gene names (row names)
head(row.names(pbmc.seurat@raw.data))
[1] "MIR1302-10" "FAM138A" "OR4F5" "RP11-34P13.7"
[5] "RP11-34P13.8" "AL627309.1"
length(row.names(pbmc.seurat@raw.data))
[1] 32738
# Column names
# Sample / Cell names / Barcodes
head(colnames(pbmc.seurat@raw.data))
[1] "AAACATACAACCAC" "AAACATTGAGCTAC" "AAACATTGATCAGC" "AAACCGTGCTTCCG"
[5] "AAACCGTGTATGCG" "AAACGCACTGGTAC"
length(colnames(pbmc.seurat@raw.data))
[1] 2700
# Only the corner
# The full data will be too large to see
corner(as.matrix(pbmc.seurat@raw.data))
AAACATACAACCAC AAACATTGAGCTAC AAACATTGATCAGC AAACCGTGCTTCCG
MIR1302-10 0 0 0 0
FAM138A 0 0 0 0
OR4F5 0 0 0 0
RP11-34P13.7 0 0 0 0
RP11-34P13.8 0 0 0 0
AAACCGTGTATGCG
MIR1302-10 0
FAM138A 0
OR4F5 0
RP11-34P13.7 0
RP11-34P13.8 0
# Plot genes per cell How many genes expressed per cells
complexity.per.cell <- apply(pbmc.seurat@raw.data, 2, function(x) sum(x > 0))
# Mean count per cell.
mean.count.per.cell <- apply(pbmc.seurat@raw.data, 2, function(x) mean(x))
# Gene prevalence
gene.prevalence <- apply(pbmc.seurat@raw.data, 1, function(x) sum(x > 0))
# Plot genes per cell How many genes expressed per cell
vioplot(complexity.per.cell)
stripchart(complexity.per.cell, add = TRUE, vertical = TRUE, method = "jitter",
jitter = 0.3, pch = 19)
abline(h = 200, col = "red")
abline(h = 2500, col = "blue")
title("Study Complexity")
axis(side = 1, at = 1, labels = c("Study"))
Boxplot:
Robust representation of a distribution using quantiles
Violin Plot:
Box plot with kernel density plot mirrored on sides.
plot(complexity.per.cell, mean.count.per.cell + 1)
abline(v = 200, col = "red")
abline(h = log2(4))
# hist(gene.prevalence)
hist(log2(gene.prevalence))
abline(v = 3, col = "red")
pbmc.seurat <- Setup(pbmc.seurat, min.cells = 3, min.genes = 200, do.logNormalize = TRUE,
total.expr = 10000, project = "Tutorial")
[1] "Performing log-normalization"
|
| | 0%
|
|====================== | 33%
|
|=========================================== | 67%
|
|=================================================================| 100%
[1] "Scaling data matrix"
|
| | 0%
|
|===== | 7%
|
|========= | 14%
|
|============== | 21%
|
|=================== | 29%
|
|======================= | 36%
|
|============================ | 43%
|
|================================ | 50%
|
|===================================== | 57%
|
|========================================== | 64%
|
|============================================== | 71%
|
|=================================================== | 79%
|
|======================================================== | 86%
|
|============================================================ | 93%
|
|=================================================================| 100%
Population based RNA-Seq
Today we are using
Say you were standing with one foot in the oven and one foot in an ice bucket. According to the percentage people, you should be perfectly comfortable. –Bobby Bragan
Filtering with gene prevalence:
How many times a gene's count is greater than or equal to an expression threshold throughout cells.
Other information that describes your measurements.
# Get gene names
mito.gene.names <- grep("^MT-", rownames(pbmc.seurat@data), value=TRUE)
# Get TSS normalized mitochodrial counts
col.total.counts <- Matrix::colSums(expm1(pbmc.seurat@data))
mito.percent.counts <- Matrix::colSums(expm1(pbmc.seurat@data[mito.gene.names, ]))/col.total.counts
# Add to seurat object as a metadata
pbmc.seurat <- AddMetaData(pbmc.seurat, mito.percent.counts, "percent.mitochodrial")
GenePlot(pbmc.seurat, "nUMI", "percent.mitochodrial")
dim(pbmc.seurat@data)
[1] 13714 2700
pbmc.seurat <- SubsetData(pbmc.seurat, subset.name = "nGene", accept.high = 2500)
pbmc.seurat <- SubsetData(pbmc.seurat, subset.name = "percent.mitochodrial", accept.high = 0.05)
dim(pbmc.seurat@data)
[1] 13714 2638
Saving the Seurat object
# How to save the intact object.
save(pbmc.seurat, file = "seurat_tutorial.Robj")
# How to retrieve the intact object.
load("seurat_tutorial.Robj")
You may need to export data to import into other applications.
# Log-scale expression matrix
write.table(as.matrix(pbmc.seurat@data), file = "seurat_data.txt")
# Study metadata
write.table(pbmc.seurat@data.info, file = "seurat_metadata.txt")
# What is the metadata so far
head(pbmc.seurat@data.info)
# Load Data
data("sc_example_counts")
data("sc_example_cell_info")
pd <- new("AnnotatedDataFrame", data=sc_example_cell_info)
rownames(pd) <- pd$Cell
example_sceset <- newSCESet(countData=sc_example_counts, phenoData=pd)
keep_feature <- rowSums(exprs(example_sceset)) > 0
example_sceset <- example_sceset[keep_feature,]
example_sceset <- calculateQCMetrics(example_sceset, feature_controls = 1:40)
Small data set of 40 cells.
corner(sc_example_counts)
Cell_001 Cell_002 Cell_003 Cell_004 Cell_005
Gene_0001 0 123 2 0 0
Gene_0002 575 65 3 1561 2311
Gene_0003 0 0 0 0 1213
Gene_0004 0 1 0 0 0
Gene_0005 0 0 11 0 0
corner(sc_example_cell_info)
Cell Mutation_Status Cell_Cycle Treatment
Cell_001 Cell_001 positive S treat1
Cell_002 Cell_002 positive G0 treat1
Cell_003 Cell_003 negative G1 treat1
Cell_004 Cell_004 negative S treat1
Cell_005 Cell_005 negative G1 treat2
plot(example_sceset, block1 = "Mutation_Status", block2 = "Treatment",
colour_by = "Cell_Cycle", nfeatures = 300, exprs_values = "counts")
plotExpression(example_sceset, rownames(example_sceset)[1:6],
x = "Mutation_Status", exprs_values = "exprs", colour = "Treatment")
scater_gui(example_sceset)
We have now
Next
VlnPlot(pbmc.seurat, c("GAPDH"))
VlnPlot(pbmc.seurat, c("GAPDH"))
# Plot a gene vs a gene
GenePlot(pbmc.seurat, "CD79A", "CD79B", cex.use = 1)
GenePlot(pbmc.seurat, "CD79A", "CD79B", cex.use = 1)
Things to be aware of.
Often t-SNE is performed on PCA components
# Select highly variable genese
pbmc.seurat <- MeanVarPlot(pbmc.seurat,fxn.x=expMean,fxn.y=logVarDivMean,
x.low.cutoff=0.0125,x.high.cutoff=3,
y.cutoff=0.5,do.contour=FALSE,do.plot=FALSE)
[1] "Calculating gene dispersion"
|
| | 0%
|
|===== | 7%
|
|========= | 14%
|
|============== | 21%
|
|=================== | 29%
|
|======================= | 36%
|
|============================ | 43%
|
|================================ | 50%
|
|===================================== | 57%
|
|========================================== | 64%
|
|============================================== | 71%
|
|=================================================== | 79%
|
|======================================================== | 86%
|
|============================================================ | 93%
|
|=================================================================| 100%
pbmc.seurat <- PCA(pbmc.seurat,pc.genes=pbmc.seurat@var.genes,do.print=FALSE)
# Calculate PCA projection
pbmc.seurat <- ProjectPCA(pbmc.seurat)
|
| | 0%
|
|===== | 7%
|
|========= | 14%
|
|============== | 21%
|
|=================== | 29%
|
|======================= | 36%
|
|============================ | 43%
|
|================================ | 50%
|
|===================================== | 57%
|
|========================================== | 64%
|
|============================================== | 71%
|
|=================================================== | 79%
|
|======================================================== | 86%
|
|============================================================ | 93%
|
|=================================================================| 100%
[1] "PC1"
[1] "MALAT1" "RPS27A" "PTPRCAP" "RPS27" "RPL23A" "RPS3A" "RPL3"
[8] "IL32" "LTB" "CD3D" "RPL21" "RPSA" "RPL9" "RPL13A"
[15] "RPS3" "RPS6" "RPL31" "CD3E" "RPL30" "RPS15A" "RPS25"
[22] "RPS12" "RPS18" "LDHB" "RPS23" "RPS29" "RPL27A" "RPL13"
[29] "RPLP2" "CXCR4"
[1] ""
[1] "CST3" "TYROBP" "LST1" "AIF1" "FCN1" "LYZ"
[7] "S100A9" "FTL" "FTH1" "TYMP" "FCER1G" "CFD"
[13] "LGALS1" "LGALS2" "S100A8" "CD68" "CTSS" "SERPINA1"
[19] "IFITM3" "SPI1" "SAT1" "IFI30" "COTL1" "PSAP"
[25] "CFP" "NPC2" "GRN" "S100A11" "LGALS3" "AP1S2"
[1] ""
[1] ""
[1] "PC2"
[1] "CD79A" "MS4A1" "TCL1A" "HLA-DQA1" "HLA-DQB1"
[6] "LINC00926" "RPL18A" "CD79B" "HLA-DRA" "VPREB3"
[11] "RPL32" "LTB" "RPL13A" "RPL13" "FCER2"
[16] "HLA-DQA2" "RPL11" "CD74" "HLA-DRB1" "BANK1"
[21] "CD37" "RPS23" "RPS27" "RPL8" "HLA-DPB1"
[26] "HLA-DMA" "RPL12" "RPS18" "TSPAN13" "FCRLA"
[1] ""
[1] "NKG7" "GZMB" "PRF1" "CST7" "GZMA" "FGFBP2" "GNLY"
[8] "CTSW" "SPON2" "GZMH" "CCL4" "B2M" "FCGR3A" "CCL5"
[15] "XCL2" "KLRD1" "CD247" "CLIC3" "GZMM" "AKR1C3" "SRGN"
[22] "TTC38" "HLA-C" "HCST" "PRSS23" "HOPX" "IGFBP7" "S1PR5"
[29] "ITGB2" "GPR56"
[1] ""
[1] ""
[1] "PC3"
[1] "PPBP" "PF4" "SDPR" "GNG11" "SPARC"
[6] "HIST1H2AC" "NRGN" "GP9" "RGS18" "TUBB1"
[11] "CLU" "AP001189.4" "CD9" "ITGA2B" "PTCRA"
[16] "TMEM40" "CA2" "ACRBP" "MMD" "TREML1"
[21] "F13A1" "PGRMC1" "SEPT5" "MYL9" "TSC22D1"
[26] "MPP1" "CMTM5" "PTGS1" "SNCA" "RUFY1"
[1] ""
[1] "RPL10" "RPS2" "RPL11" "RPL18A" "RPL32" "RPL28" "RPS19"
[8] "RPL12" "RPL19" "RPL13" "RPS6" "RPS14" "RPS15" "TMSB10"
[15] "RPLP1" "RPL29" "RPL6" "RPL26" "RPS4X" "RPS16" "RPS3"
[22] "EEF1A1" "RPL15" "RPL13A" "RPS7" "RPL8" "RPS12" "RPL23A"
[29] "RPS18" "RPLP2"
[1] ""
[1] ""
[1] "PC4"
[1] "CD79A" "HLA-DQA1" "CD79B" "MS4A1" "HLA-DQB1"
[6] "CD74" "HLA-DPB1" "HLA-DPA1" "HLA-DRB1" "TCL1A"
[11] "HLA-DRA" "LINC00926" "HLA-DQA2" "HLA-DRB5" "VPREB3"
[16] "HLA-DMA" "HLA-DMB" "FCER2" "BANK1" "HVCN1"
[21] "GZMB" "HLA-DOB" "PDLIM1" "FCRLA" "TSPAN13"
[26] "FGFBP2" "CD72" "EAF2" "PKIG" "SPIB"
[1] ""
[1] "CD3D" "LDHB" "RPS14" "IL7R" "CD3E" "RPL32" "VIM"
[8] "IL32" "RPS12" "NOSIP" "RPL28" "GIMAP7" "RPL11" "RPL13"
[15] "FYB" "ZFP36L2" "RPL10" "AQP3" "JUNB" "RPS25" "RPLP1"
[22] "MAL" "LEF1" "RGCC" "S100A6" "FOS" "RPS3" "CD2"
[29] "RPL35A" "RPL36"
[1] ""
[1] ""
[1] "PC5"
[1] "LTB" "TMEM66" "LDHB" "HSPA8" "PABPC1" "NPM1"
[7] "RNASET2" "JUNB" "SOD1" "CD52" "NAP1L1" "CALM2"
[13] "EEF1A1" "RPSA" "HINT1" "IL7R" "VIM" "FXYD5"
[19] "AQP3" "ARHGDIB" "LDHA" "HNRNPA1" "NACA" "HSP90AA1"
[25] "GSTK1" "ITM2B" "RPLP0" "RPS19" "ACTG1" "RPS10"
[1] ""
[1] "S100A8" "FGFBP2" "GZMB" "S100A9" "NKG7" "CCL4" "S100A12"
[8] "LGALS2" "RBP7" "GNLY" "CST7" "SPON2" "GZMA" "PRF1"
[15] "CCL3" "FOLR3" "MS4A6A" "GZMH" "CD14" "PRSS23" "S1PR5"
[22] "KLRD1" "TYROBP" "XCL2" "CTSW" "CCL5" "CLIC3" "CEBPD"
[29] "TTC38" "GSTP1"
[1] ""
[1] ""
# Can plot top genes for top components
PrintPCA(pbmc.seurat, pcs.print = 1:2, genes.print = 5, use.full = TRUE)
[1] "PC1"
[1] "MALAT1" "RPS27A" "PTPRCAP" "RPS27" "RPL23A"
[1] ""
[1] "CST3" "TYROBP" "LST1" "AIF1" "FCN1"
[1] ""
[1] ""
[1] "PC2"
[1] "CD79A" "MS4A1" "TCL1A" "HLA-DQA1" "HLA-DQB1"
[1] ""
[1] "NKG7" "GZMB" "PRF1" "CST7" "GZMA"
[1] ""
[1] ""
# Calculate PCA projection
pbmc.seurat <- ProjectPCA(pbmc.seurat)
|
| | 0%
|
|===== | 7%
|
|========= | 14%
|
|============== | 21%
|
|=================== | 29%
|
|======================= | 36%
|
|============================ | 43%
|
|================================ | 50%
|
|===================================== | 57%
|
|========================================== | 64%
|
|============================================== | 71%
|
|=================================================== | 79%
|
|======================================================== | 86%
|
|============================================================ | 93%
|
|=================================================================| 100%
[1] "PC1"
[1] "MALAT1" "RPS27A" "PTPRCAP" "RPS27" "RPL23A" "RPS3A" "RPL3"
[8] "IL32" "LTB" "CD3D" "RPL21" "RPSA" "RPL9" "RPL13A"
[15] "RPS3" "RPS6" "RPL31" "CD3E" "RPL30" "RPS15A" "RPS25"
[22] "RPS12" "RPS18" "LDHB" "RPS23" "RPS29" "RPL27A" "RPL13"
[29] "RPLP2" "CXCR4"
[1] ""
[1] "CST3" "TYROBP" "LST1" "AIF1" "FCN1" "LYZ"
[7] "S100A9" "FTL" "FTH1" "TYMP" "FCER1G" "CFD"
[13] "LGALS1" "LGALS2" "S100A8" "CD68" "CTSS" "SERPINA1"
[19] "IFITM3" "SPI1" "SAT1" "IFI30" "COTL1" "PSAP"
[25] "CFP" "NPC2" "GRN" "S100A11" "LGALS3" "AP1S2"
[1] ""
[1] ""
[1] "PC2"
[1] "CD79A" "MS4A1" "TCL1A" "HLA-DQA1" "HLA-DQB1"
[6] "LINC00926" "RPL18A" "CD79B" "HLA-DRA" "VPREB3"
[11] "RPL32" "LTB" "RPL13A" "RPL13" "FCER2"
[16] "HLA-DQA2" "RPL11" "CD74" "HLA-DRB1" "BANK1"
[21] "CD37" "RPS23" "RPS27" "RPL8" "HLA-DPB1"
[26] "HLA-DMA" "RPL12" "RPS18" "TSPAN13" "FCRLA"
[1] ""
[1] "NKG7" "GZMB" "PRF1" "CST7" "GZMA" "FGFBP2" "GNLY"
[8] "CTSW" "SPON2" "GZMH" "CCL4" "B2M" "FCGR3A" "CCL5"
[15] "XCL2" "KLRD1" "CD247" "CLIC3" "GZMM" "AKR1C3" "SRGN"
[22] "TTC38" "HLA-C" "HCST" "PRSS23" "HOPX" "IGFBP7" "S1PR5"
[29] "ITGB2" "GPR56"
[1] ""
[1] ""
[1] "PC3"
[1] "PPBP" "PF4" "SDPR" "GNG11" "SPARC"
[6] "HIST1H2AC" "NRGN" "GP9" "RGS18" "TUBB1"
[11] "CLU" "AP001189.4" "CD9" "ITGA2B" "PTCRA"
[16] "TMEM40" "CA2" "ACRBP" "MMD" "TREML1"
[21] "F13A1" "PGRMC1" "SEPT5" "MYL9" "TSC22D1"
[26] "MPP1" "CMTM5" "PTGS1" "SNCA" "RUFY1"
[1] ""
[1] "RPL10" "RPS2" "RPL11" "RPL18A" "RPL32" "RPL28" "RPS19"
[8] "RPL12" "RPL19" "RPL13" "RPS6" "RPS14" "RPS15" "TMSB10"
[15] "RPLP1" "RPL29" "RPL6" "RPL26" "RPS4X" "RPS16" "RPS3"
[22] "EEF1A1" "RPL15" "RPL13A" "RPS7" "RPL8" "RPS12" "RPL23A"
[29] "RPS18" "RPLP2"
[1] ""
[1] ""
[1] "PC4"
[1] "CD79A" "HLA-DQA1" "CD79B" "MS4A1" "HLA-DQB1"
[6] "CD74" "HLA-DPB1" "HLA-DPA1" "HLA-DRB1" "TCL1A"
[11] "HLA-DRA" "LINC00926" "HLA-DQA2" "HLA-DRB5" "VPREB3"
[16] "HLA-DMA" "HLA-DMB" "FCER2" "BANK1" "HVCN1"
[21] "GZMB" "HLA-DOB" "PDLIM1" "FCRLA" "TSPAN13"
[26] "FGFBP2" "CD72" "EAF2" "PKIG" "SPIB"
[1] ""
[1] "CD3D" "LDHB" "RPS14" "IL7R" "CD3E" "RPL32" "VIM"
[8] "IL32" "RPS12" "NOSIP" "RPL28" "GIMAP7" "RPL11" "RPL13"
[15] "FYB" "ZFP36L2" "RPL10" "AQP3" "JUNB" "RPS25" "RPLP1"
[22] "MAL" "LEF1" "RGCC" "S100A6" "FOS" "RPS3" "CD2"
[29] "RPL35A" "RPL36"
[1] ""
[1] ""
[1] "PC5"
[1] "LTB" "TMEM66" "LDHB" "HSPA8" "PABPC1" "NPM1"
[7] "RNASET2" "JUNB" "SOD1" "CD52" "NAP1L1" "CALM2"
[13] "EEF1A1" "RPSA" "HINT1" "IL7R" "VIM" "FXYD5"
[19] "AQP3" "ARHGDIB" "LDHA" "HNRNPA1" "NACA" "HSP90AA1"
[25] "GSTK1" "ITM2B" "RPLP0" "RPS19" "ACTG1" "RPS10"
[1] ""
[1] "S100A8" "FGFBP2" "GZMB" "S100A9" "NKG7" "CCL4" "S100A12"
[8] "LGALS2" "RBP7" "GNLY" "CST7" "SPON2" "GZMA" "PRF1"
[15] "CCL3" "FOLR3" "MS4A6A" "GZMH" "CD14" "PRSS23" "S1PR5"
[22] "KLRD1" "TYROBP" "XCL2" "CTSW" "CCL5" "CLIC3" "CEBPD"
[29] "TTC38" "GSTP1"
[1] ""
[1] ""
# Can plot top genes for top components
PrintPCA(pbmc.seurat, pcs.print = 1:2, genes.print = 5, use.full = TRUE)
[1] "PC1"
[1] "MALAT1" "RPS27A" "PTPRCAP" "RPS27" "RPL23A"
[1] ""
[1] "CST3" "TYROBP" "LST1" "AIF1" "FCN1"
[1] ""
[1] ""
[1] "PC2"
[1] "CD79A" "MS4A1" "TCL1A" "HLA-DQA1" "HLA-DQB1"
[1] ""
[1] "NKG7" "GZMB" "PRF1" "CST7" "GZMA"
[1] ""
[1] ""
VizPCA(pbmc.seurat, pcs.use=1:2)
PCAPlot(pbmc.seurat, 1, 2)
PCHeatmap(pbmc.seurat, pc.use=1, cells.use=100, do.balanced=TRUE)
# Time Intensive
# Jackstraw
# pbmc.seurat <- JackStraw(pbmc.seurat, num.replicate = 100, do.print = FALSE)
How do we choose how many components to use?
# Scree (elbow) plot
PCElbowPlot(pbmc.seurat)
# 1 minute
pbmc.seurat <- FindClusters(pbmc.seurat, pc.use = 1:10, resolution = 0.6, print.output = 0, save.SNN = TRUE)
# Calculate t-SNE Ordination
pbmc.seurat <- RunTSNE(pbmc.seurat, dims.use = 1:10, do.fast = TRUE)
# Plot
TSNEPlot(pbmc.seurat)
This is not PCA
PCA
t-SNE
Now that we have subclusters of cell populations plotting genes through subclusters is identical to before.
VlnPlot(pbmc.seurat, c("MS4A1","CD79A"))
You can also gene expression through out the cell ordination.
FeaturePlot(pbmc.seurat, c("MS4A1","CD3E", "GNLY", "FCER1A"), cols.use = c("grey","blue"))
It is important to know cells are expressing expected genes.
FeaturePlot(pbmc.seurat, c("nGene"), cols.use = c("grey","blue"))
We are going to make a fake batch affect (site) and plot this as an example of how one can visualize unwanted signal.
# Making Fake Data
fake.sites <- as.integer(pbmc.seurat@ident %in% c(5,2,8,7))
names(fake.sites) <- colnames(pbmc.seurat@data)
# Add metadata
pbmc.seurat <- AddMetaData(pbmc.seurat, fake.sites, "site")
# Plot feature
FeaturePlot(pbmc.seurat, c("site"), cols.use = c("green","orange"))
cell.labels <- pbmc.seurat@ident
corner(cell.labels)
AAACATACAACCAC AAACATTGAGCTAC AAACATTGATCAGC AAACCGTGCTTCCG AAACCGTGTATGCG
1 3 0 5 6
Levels: 0 1 2 3 4 5 6 7 8
For each group (ES or MEF).
Differential Expression.
data(es.mef.small)
dim(es.mef.small)
[1] 14897 40
cd <- clean.counts(es.mef.small, min.lib.size=1000, min.reads = 1, min.detected = 1)
dim(cd)
[1] 12142 40
## Setting up cells groups
data.groups <- rep(NA, ncol(es.mef.small))
data.groups[ grep("MEF", names(es.mef.small)) ] <- "MEF"
data.groups[ grep("ESC", names(es.mef.small)) ] <- "ESC"
data.groups <- factor(data.groups, levels = c("ESC","MEF"))
names(data.groups) <- colnames(es.mef.small)
table(data.groups)
data.groups
ESC MEF
20 20
## Calculate error models
## Time Intensive step
# o.ifm <- scde.error.models(counts=cd, groups= data.groups, n.cores=4,
# threshold.segmentation=TRUE, save.crossfit.plots=FALSE,
# save.model.plots=FALSE, verbose=1)
## Precomputed
data(o.ifm)
## Calculate error models
## Time Intensive step
# o.ifm <- scde.error.models(counts=cd, groups= data.groups, n.cores=4,
# threshold.segmentation=TRUE, save.crossfit.plots=FALSE,
# save.model.plots=FALSE, verbose=1)
# Check number of cores
detectCores()
[1] 8
# Error model coefficients (cells = rows)
# corr.a = slope of the correlated component fit
# Negative corr.a could be bad cells
# corr.b intercept of the correlated component fit
# corr.theta is NB over-dispersion
# fail.r background poisson rate
head(o.ifm)
conc.b conc.a fail.r corr.b corr.a corr.theta
ESC_10 -1.449443 0.5639140 -2.302585 0.7148157 0.6496142 0.7732069
ESC_11 -3.244421 0.7327046 -2.302585 1.5918205 0.5351960 0.7070433
ESC_12 -4.472559 0.8073935 -2.302585 1.5203470 0.4909147 0.7372590
ESC_13 -5.208909 0.8804523 -2.302585 1.2539230 0.5242493 0.8215473
ESC_14 -4.124369 0.7794612 -2.302585 1.1127353 0.5620266 0.7456712
ESC_15 -5.410838 0.9324758 -2.302585 1.1571732 0.5482784 0.7712750
dim(o.ifm)
[1] 40 6
valid.cells <- o.ifm$corr.a > 0
table(valid.cells)
valid.cells
TRUE
40
o.ifm <- o.ifm[valid.cells, ]
dim(o.ifm)
[1] 40 6
## Calculate the Prior (starting value)
o.prior <- scde.expression.prior(models=o.ifm, counts=cd, length.out=400, show.plot=FALSE)
## Setting up cells groups
data.groups <- rep(NA, nrow(o.ifm))
data.groups[ grep("MEF", rownames(o.ifm)) ] <- "MEF"
data.groups[ grep("ESC", rownames(o.ifm)) ] <- "ESC"
data.groups <- factor(data.groups, levels = c("ESC","MEF"))
names(data.groups) <- row.names(o.ifm)
## Perform T-test like analysis
# 2 minutes on standard computer, 1 core
#ediff <- scde.expression.difference(o.ifm, cd, o.prior, groups=data.groups, n.randomizations=100, n.cores=2, verbose=1)
load("data/ediff.Robj")
head(ediff[order(ediff$Z, decreasing = TRUE), ])
lb mle ub ce Z cZ
Dppa5a 8.075220 9.984631 11.575807 8.075220 7.160813 5.989598
Pou5f1 5.370220 7.200073 9.189043 5.370220 7.160328 5.989598
Gm13242 5.688455 7.677425 9.785734 5.688455 7.159979 5.989598
Tdh 5.807793 8.075220 10.302866 5.807793 7.159589 5.989598
Ift46 5.449779 7.359190 9.228822 5.449779 7.150242 5.989598
4930509G22Rik 5.409999 7.478528 9.785734 5.409999 7.115605 5.978296
write.table(ediff[order(abs(ediff$Z), decreasing = TRUE), ],
file = "data/scde_results.txt", row.names = TRUE, col.names = TRUE, sep = "\t", quote = FALSE)
scde.test.gene.expression.difference("Tdh", models = o.ifm, counts = cd, prior = o.prior)
lb mle ub ce Z cZ
Tdh 5.728235 8.03544 10.30287 5.728235 7.151425 7.151425
# scde.browse.diffexp(ediff, o.ifm, cd, o.prior, groups = groups, name = "diffexp1", port = 1299)
Fan et al.
data(pollen)
# Original genes and cells (count matrix)
dim(pollen)
[1] 23710 64
# Filter poor cells
pollen.clean <- clean.counts(pollen)
# Cleaned matrix dimensions
dim(pollen.clean)
[1] 11310 64
name.keys <- gsub("^Hi_(.*)_.*", "\\1", colnames(pollen.clean))
name.keys
[1] "NPC" "NPC" "NPC" "NPC" "NPC" "NPC" "NPC"
[8] "NPC" "NPC" "NPC" "NPC" "NPC" "NPC" "NPC"
[15] "NPC" "GW16" "GW16" "GW21" "GW21+3" "GW21+3" "GW16"
[22] "GW21+3" "GW21+3" "GW16" "GW16" "GW16" "GW16" "GW16"
[29] "GW16" "GW16" "GW16" "GW16" "GW16" "GW21" "GW21"
[36] "GW16" "GW16" "GW21" "GW16" "GW16" "GW16" "GW16"
[43] "GW16" "GW21" "GW21" "GW21" "GW21+3" "GW16" "GW16"
[50] "GW16" "GW16" "GW16" "GW21" "GW21+3" "GW21+3" "GW21+3"
[57] "GW21+3" "GW21+3" "GW21+3" "GW21+3" "GW21+3" "GW21+3" "GW21+3"
[64] "GW21+3"
l2cols <- c("coral4", "olivedrab3", "skyblue2", "slateblue3")[as.integer(factor(name.keys,
levels = c("NPC", "GW16", "GW21", "GW21+3")))]
l2cols
[1] "coral4" "coral4" "coral4" "coral4" "coral4"
[6] "coral4" "coral4" "coral4" "coral4" "coral4"
[11] "coral4" "coral4" "coral4" "coral4" "coral4"
[16] "olivedrab3" "olivedrab3" "skyblue2" "slateblue3" "slateblue3"
[21] "olivedrab3" "slateblue3" "slateblue3" "olivedrab3" "olivedrab3"
[26] "olivedrab3" "olivedrab3" "olivedrab3" "olivedrab3" "olivedrab3"
[31] "olivedrab3" "olivedrab3" "olivedrab3" "skyblue2" "skyblue2"
[36] "olivedrab3" "olivedrab3" "skyblue2" "olivedrab3" "olivedrab3"
[41] "olivedrab3" "olivedrab3" "olivedrab3" "skyblue2" "skyblue2"
[46] "skyblue2" "slateblue3" "olivedrab3" "olivedrab3" "olivedrab3"
[51] "olivedrab3" "olivedrab3" "skyblue2" "slateblue3" "slateblue3"
[56] "slateblue3" "slateblue3" "slateblue3" "slateblue3" "slateblue3"
[61] "slateblue3" "slateblue3" "slateblue3" "slateblue3"
# knn <- knn.error.models(pollen.clean, k=ncol(pollen.clean)/4, n.cores=2,
# min.count.threshold=2, min.nonfailed=5, max.model.plots=10) Precomputed
# data
data(knn)
# varinfo <- pagoda.varnorm(knn, counts=pollen.clean,
# trim=3/ncol(pollen.clean), max.adj.var=5, n.cores=1, plot=TRUE)
load("data/varinfo.Robj")
# list top overdispersed genes
sort(varinfo$arv, decreasing = TRUE)[1:10]
# Control for complexity
varinfo <- pagoda.subtract.aspect(varinfo, colSums(pollen.clean[, rownames(knn)] >
0))
# varinfo <- pagoda.varnorm(knn, counts=pollen.clean,
# trim=3/ncol(pollen.clean), max.adj.var=5, n.cores=2, plot=TRUE)
load("data/varinfo.Robj")
# list top overdispersed genes
sort(varinfo$arv, decreasing = TRUE)[1:10]
DCX EGR1 FOS IGFBPL1 MALAT1 MEF2C STMN2 TOP2A
5.000000 5.000000 5.000000 5.000000 5.000000 5.000000 5.000000 5.000000
BCL11A SOX4
4.739497 4.489101
# Control for complexity
varinfo <- pagoda.subtract.aspect(varinfo, colSums(pollen.clean[, rownames(knn)] >
0))
library(org.Hs.eg.db)
# translate gene names to ids
ids <- unlist(lapply(mget(rownames(pollen.clean), org.Hs.egALIAS2EG, ifnotfound = NA),
function(x) x[1]))
rids <- names(ids)
names(rids) <- ids
# convert GO lists from ids to gene names
gos.interest <- unique(c(ls(org.Hs.egGO2ALLEGS)[1:100], "GO:0022008", "GO:0048699",
"GO:0000280", "GO:0007067"))
go.env <- lapply(mget(gos.interest, org.Hs.egGO2ALLEGS), function(x) as.character(na.omit(rids[x])))
go.env <- clean.gos(go.env) # remove GOs with too few or too many genes
go.env <- list2env(go.env) # convert to an environment
# pwpca <- pagoda.pathway.wPCA(varinfo, go.env, n.components = 1, n.cores =
# 1)
load("data/pwpca.Robj")
df <- pagoda.top.aspects(pwpca, return.table = TRUE, plot = TRUE, z.score = 1.96)
head(df)
# clpca <- pagoda.gene.clusters(varinfo, trim = 7.1/ncol(varinfo$mat),
# n.clusters = 50, n.cores = 1, plot = TRUE)
load("data/clpca.Robj")
df <- pagoda.top.aspects(pwpca, clpca, return.table = TRUE, plot = TRUE, z.score = 1.96)
head(df)
name npc n score z adj.z sh.z adj.sh.z
56 geneCluster.6 1 391 3.289412 13.814757 13.530139 NA NA
49 GO:0000280 1 428 1.587359 11.592060 11.252131 NA NA
50 GO:0007067 1 362 1.585331 10.873998 10.576419 NA NA
79 geneCluster.29 1 171 1.583733 5.162516 4.523195 NA NA
14 GO:0000070 1 116 1.446979 5.625549 5.247594 NA NA
89 geneCluster.39 1 178 1.392980 4.137589 3.438496 NA NA
# Get full info on the top aspects tam <- pagoda.top.aspects(pwpca, clpca,
# n.cells = NULL, z.score = qnorm(0.01/2, lower.tail = FALSE))
load("data/tam.Robj")
# Determine overall cell clustering
hc <- pagoda.cluster.cells(tam, varinfo)
# tamr <- pagoda.reduce.loading.redundancy(tam, pwpca, clpca)
load("data/tamr.Robj")
# tamr2 <- pagoda.reduce.redundancy(tamr, distance.threshold = 0.9, plot =
# TRUE, cell.clustering = hc, labRow = NA, labCol = NA, box = TRUE, margins
# = c(0.5, 0.5), trim = 0)
load("data/tamr2.Robj")
col.cols <- rbind(groups = cutree(hc, 3))
pagoda.view.aspects(tamr2, cell.clustering = hc, box = TRUE, labCol = NA, margins = c(0.5,
20), col.cols = rbind(l2cols))
## compile a browsable app, showing top three clusters with the top color bar
## app <- make.pagoda.app(tamr2, tam, varinfo, go.env, pwpca, clpca, col.cols
## = col.cols, cell.clustering = hc, title = 'NPCs') show app in the browser
## (port 1468) show.app(app, 'pollen', browse = TRUE, port = 1468)
# pdf( 'data/my_file.pdf', useDingbats = FALSE ) # Start pdf plot( 1:10,
# log(1:10 ) ) # plot in to the pdf file plot( seq(0,.9,.1), sin(0:9) ) #
# another plot for the pdf file dev.off() # Close pdf file ( very important
# )